Mejorando la generalización y eficiencia de datos con difusión en RL multi-agente offline
DOM2, un modelo de difusión para RL multi-agente offline, mejora la generalización y eficiencia de datos hasta 20 veces. Descubre cómo supera a los métodos actuales.